Scopo di questo report è quello di esplorare e analizzare la natura della sparatorie avvenute a New York dal 2006 fino alla fine del 2020, attraverso analisi descrittive, tassi sulla popolazione, grafici e mappe.
Parole chiave: analisi dati, NYPD, Mappe, R, Google maps.
I dati presi in considerazione rappresentano una ripartizione di ogni sparatoria avvenuta a New York dal 2006 fino alla fine del 2020. Questi dati vengono estratti manualmente ogni trimestre e rivisti dall’Office of Management Analysis and Planning prima di essere pubblicati sul sito Web del NYPD, dove si sono scaricati https://data.cityofnewyork.us/Public-Safety/NYPD-Shooting-Incident-Data-Historic-/833y-fsy8. Ogni record rappresenta una sparatoria avvenuta nella città di New York e include informazioni sull’evento: il luogo in cui si è verificato; informazioni relative ai dati demografici dei sospetti e delle vittime.
Caricamento delle librerie e del dataset:
library(sf)
library(maps)
library(pamr)
library(ggplot2)
library(rgdal)
library(png)
library(grid)
library(cluster)
library(rgdal)
library(ggmap)
library(jsonlite)
library(RCurl)
library(readr)
library(dplyr)
library(leaflet)
library(httr)
library(gridExtra)
NYPD <- read_delim("NYPD_Shooting_Incident_Data__Historic_.csv",
";", escape_double = FALSE, trim_ws = TRUE)
dim(NYPD)
## [1] 23585 19
Il dataset contiene 23585 record per 19 variabili, che sono:
names(NYPD)
## [1] "INCIDENT_KEY" "OCCUR_DATE"
## [3] "OCCUR_TIME" "BORO"
## [5] "PRECINCT" "JURISDICTION_CODE"
## [7] "LOCATION_DESC" "STATISTICAL_MURDER_FLAG"
## [9] "PERP_AGE_GROUP" "PERP_SEX"
## [11] "PERP_RACE" "VIC_AGE_GROUP"
## [13] "VIC_SEX" "VIC_RACE"
## [15] "X_COORD_CD" "Y_COORD_CD"
## [17] "Latitude" "Longitude"
## [19] "Lon_Lat"
head(NYPD[, c(1,4,8,12:14, 17:18)])
## # A tibble: 6 × 8
## INCIDENT_KEY BORO STATISTICAL_MUR… VIC_AGE_GROUP VIC_SEX VIC_RACE Latitude
## <dbl> <chr> <lgl> <chr> <chr> <chr> <dbl>
## 1 24050482 BRONX TRUE 25-44 F BLACK H… 40.9
## 2 77673979 QUEENS FALSE 65+ M WHITE 40.7
## 3 203350417 BROOKLYN FALSE 18-24 F BLACK 40.7
## 4 80584527 BRONX FALSE <18 M BLACK 40.8
## 5 90843766 QUEENS FALSE 18-24 M BLACK 40.6
## 6 92393427 BROOKLYN FALSE <18 M BLACK 40.6
## # … with 1 more variable: Longitude <dbl>
Per le analisi si utilizzeranno le variabili relative alla posizione dell’avvenuta sparatoria tramite latitudine e longitudine; la variaibile dei distretti dove è avvenuta; se ha provocato delle morti; infine le caratteristiche demografiche delle vittime.
Prima di tutto, si vuole analizzare la distribuzione delle sparatorie per distretto:
La stessa informazione si può visualizzare sottoforma di mappa, utilizzando le coordinate geografiche. Ogni sparatoria ha le sue coordinate geografiche, con la funzione ..level.. viene calcolata la densità spaziale del numero di sparatorie per metro quadro.
ggmap(nyc_map)+
stat_density2d(data = NYPD,
aes(x = Longitude, y = Latitude, fill= ..level.., alpha=..level..),
alpha=0.15,
bins=30,
geom = "polygon") +
scale_fill_gradient(low = "red", high = "blue", name="Shootings level per square meter") +
scale_alpha(range = c(0, 0.08), guide = "none") +
scale_size(range = c(0,0.75)) +
ggtitle("Shootings for Boroughs")+
theme(axis.ticks = element_blank(),
axis.text = element_blank(),
legend.position="right") +
theme(plot.title = element_text(hjust = 0.5))
I valori della distribuzione di frequenza vanno confrontati con la popolazione residente. Si sceglie di valutare i tassi di sparatorie in base alla popolazione dei distretti di New York per 100.000 abitanti. Nel 2020\(^{(1)}\), anno di chiusura di questo studio, si sono registrati:
Pertanto risulta che, nonostante a Brooklyn si registrino più sparatorie nel totale, il tasso specifico delle sparatorie a New York è di molto maggiore nel distretto del Bronx.
Siccome, la concentrazione delle sparatorie non è equiparata, si decide di affrontare l’analisi per distretti per cogliere le differenze principali tra questi.
Nel distretto di Brooklyn si sono registrati 9734 incidenti, cioè il 41.3% del totale, con un tasso specifico di 244.91 per 100.000 abitanti. Tra questi, il 19.5% hanno causato morti, rispetto al restante 80.5%.
ny.map_brooklyn <- get_map("Brooklyn, New York, NY",zoom=12)
map_brooklyn<-ggmap(ny.map_brooklyn,
base_layer = ggplot(data = ny_brookl , aes(x = Longitude, y = Latitude))) +
geom_point(aes(fill = Murder, col = Murder), alpha = 0.5, size = 1) +
scale_color_manual(values = c("#0105cd","#ff19fc"))
map_brooklyn
Tra le vittime il 90.5% sono di sesso maschile e il 9.5% sono di sesso femminile. Inoltre, la classe di età più colpita sembra essere quella tra i 24-44 (44.3%). Infine, l’etnia afroamericana sembra essere la più colpita (83.4%) e la seconda sembra essere la categoria degli ispanici (12.8%).
Nel distretto del Bronx si sono registrati 6701 incidenti, cioè il 28% del totale, con un tasso specifico di 445.03 per 100.000 abitanti. Tra questi, il 18.6% hanno causato morti, rispetto al restante 81.4%.
Tra le vittime il 91.3% sono di sesso maschile e il 8.7% sono di sesso femminile. La classe di età più colpita sembra essere quella tra i 25-44 (41.4%). Infine, anche qui, l’etnia afroamericana sembra essere la più colpita (57.2%), la seconda sembra essere la categoria degli ispanici (39.9%), di molto superiore alla percentuale delle vittime della stessa categoria di Brooklyn.
Nel distretto del Queens si sono registrati 3532 incidenti, cioè il 15% del totale, con un tasso specifico di 140.39 per 100.000 abitanti. Tra questi, il 19.7% hanno causato morti, rispetto al restante 83.3%.
Tra le vittime il 90% sono di sesso maschile e il 10% sono di sesso femminile. La classe di età più colpita è quella tra i 25-44 (46.1%). Infine, anche qui, l’etnia afroamericana sembra essere la più colpita (72.7%), la seconda sembra essere la categoria degli ispanici (19.2%), di molto inferiore alla percentuale delle vittime della stessa categoria di Bronx.
Nel distretto del Manhattan si sono registrati 2922 incidenti, cioè il 12% del totale, con un tasso specifico di 172.47 per 100.000 abitanti. Tra questi, il 17.6% hanno causato morti, rispetto al restante 82.4%.
Tra le vittime il 94.4% sono di sesso maschile e il 9.6% sono di sesso femminile. La classe di età più colpita sembra essere quella tra i 25-44 (44.2%). Infine, anche qui, l’etnia afroamericana sembra essere la più colpita (66.62%) e la seconda sembra essere la categoria degli ispanici (33%), simile alla percentuale delle vittime della stessa categoria di Bronx.
Nel distretto di Staten Island si sono registrati 696 incidenti, cioè il 3% del totale, con un tasso specifico di 146.83 per 100.000 abitanti. Tra questi, il 20.5% hanno causato morti, rispetto al restante 79.5%.
Tra le vittime il 88.9% sono di sesso maschile e il 11.1% sono di sesso femminile. La classe di età più colpita sembra essere quella tra i 25-44 (42.1%). Infine, l’etnia afroamericana sembra essere la più colpita (70.8%), la seconda più colpita sembra essere la categoria degli ispanici (18.1%), mentre cresce la percentuale delle vittime bianche rispetto agli altri distretti (10.3%).
Come si è accertato prima, tali informazioni possono variare in base alla popolazione presente sul territorio, in particolare per l’etnia dove si registrano nel 2020 diverse concentrazioni all’interno dei distretti.
Population %>%
kbl(caption = "Population 2020 by race among the Boroughs in millions") %>%
kable_styling()
| Boroughs | Black | Hispanic | White | Other |
|---|---|---|---|---|
| Brooklyn | 968.427 | 516.426 | 729.696 | 408.355 |
| Staten Island | 46.835 | 96.960 | 277.981 | 62.653 |
| Manhattan | 199.592 | 402.640 | 793.294 | 235.736 |
| Queens | 381.375 | 667.861 | 549.358 | 722.758 |
| Bronx | 419.393 | 806.463 | 130.796 | 87.632 |
Pertanto, calcolando i tassi specifici in base all’etnia per i distretti risulta che:
l’etnia afroamericana resta la più colpita, siccome il tasso specifico è molto maggiore rispetto alle altre categorie nei distretti. Il maggior tasso si registra nel distretto di Staten Island (1052.53 per 100.000 abitanti), dove nonostante ci sia meno concentrazione di popolazione afroamericana, questi vengono più colpiti;
l’etnia ispanica viene più colpita nel ditretto del Bronx (331.7 per 100.000 abitanti), dove è anche l’etnia più presente;
l’etnia bianca viene più colpita nel distretto di Manhattan (121.46 per 100.000 abitanti), dove è anche l’etnia più presente.
Infine, si è prodotta una mappa interattiva dove vengono evidenziate le sparatorie in base ai quartieri, dove il colore rosso acceso indica che in quel punto di coordinate si sono verificate più sparatorie.
Nonostante Manhattan registri un tasso relativamente basso di sparatorie rispetto agli altri distretti (172.47 per 100.000 abitanti residenti a Manhattan), si può notare che i quartieri di Manhattan più vicini al Bronx, dove si registra quello più alto in generale (455.03 per 100.000 abitanti residenti nel Bronx), siano quelli lo influenzano maggiormente.
######### TOTALE SPARI
#RdYlBu <- colorFactor("RdYlBu", domain = NYPD$STATISTICAL_MURDER_FLAG)
leaflet(nyc_neighborhoods) %>%
addCircles(lat = ~points$lat , lng = ~points$lng, #layerId = points$neighborhood
radius = 30,
weight = 20,
stroke = FALSE,
#fillColor = ~NYPD$STATISTICAL_MURDER_FLAG,
fillOpacity = 0.2,
#color = c("#OC6AF7","#00FA14")
color = "red",
) %>%
addTiles() %>%
addPolygons(popup = ~neighborhood) %>%
addProviderTiles("CartoDB.Positron")
Lo scopo di questo report era quello di esplorare e analizzare la natura della sparatorie avvenute a New York dal 2006 fino alla fine del 2020, attraverso analisi descrittive, tassi sulla popolazione, grafici e mappe.
Il maggior numero di sparatorie in base alla popolazione residente è avvenuta nel Bronx, dove si è osservato che le vittime più colpite sono di etnia afroamericana, seguite da quelli di etnia ispanica. Inolte, si nota che la vicinanza dei quartieri di Manhattan alle zone appartenenti al distretto del Bronx sembra avere un impatto crescente sul tasso di sparatorie nel distretto di Manhattan.
Sulla base di questi risultati, si potrebbe approfondire l’analisi relativa alla possibile influenza del fenomeno nei quartieri di Manhattan confinanti con il Bronx.
(1): Per le stime della popolazione di New York: https://www1.nyc.gov/site/planning/planning-level/nyc-population/2020-census.page